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元 数据 方案 比较 分 析 


摘要 : [目的 /意义 ] 开放 政府 数据 有 利于 实现 数据 资源 的 合理 开发 和 利用 ， 鼓 励 社 会 创新 ， 促 进 经 
济 发 展 。 保 障 开 放 政 府 数据 的 有 效 利 用 、 社 会 化 增值 离 不 开 高 质量 的 元 数据 方案 的 支持 。 [ 方法 / ] 
通过 研究 分 析 国内 外 开放 政府 数据 的 相关 研究 成 果 ， 对 我 国 主要 的 地 方 政府 开放 数据 平台 的 元 数据 方案 进 
行 调研 ， 并 与 美国 政府 开放 政府 数据 元 数据 标准 进行 比较 分 析 .[ 结果 / 结论 ] 结果 表明 ， 我 国 地 方 政府 
开放 数据 存在 着 元 数据 方案 各 不 相同 ， 对 数据 集 的 描述 简单 、 不 全 面 ， 格 式 以 HTML 网 页 为 主 ， 机 器 可 读 
性 不 高 等 不 足 ， 影 响 开 放 数 据 的 使 用 效果 。 因 此 ， 我 国政 府 应 借鉴 国际 上 成 熟 有 效 的 元 数据 方案 标准 ， 制 
定 统一 规范 的 元 数据 方案 ， 确 保 提供 满足 社会 需求 的 高 质量 、 高 价值 数据 。 
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(1 BIE] 

政府 数据 开放 是 指 政府 利用 现代 信息 技术 
手段 ， 主 动 将 自身 拥有 的 不 涉及 个 人 隐私 和 公 
共 安 全 的 数据 免费 开放 给 所 有 民众 。 构 建 政府 
数据 管理 、 开 放 、 查 询 和 再 利用 的 官方 平台 ， 
发 布 开 放 数 据 目 录 (Open Data Catalogs ) 是 各 
国 在 开放 政府 数据 运动 中 普遍 采取 的 关键 举措 。 
自 2009 年 美国 政府 数据 开放 平台 网 站 Data.gov 
上 线 以 来 , 开放 数据 运动 在 全 球 迅速 兴起 , 英国 、 
澳大利亚 、 加 拿 大 等 国 纷纷 建立 政府 开放 数据 
FR, 2015 年 已 有 92 个 国家 被 由 互联 网 之 父 工 
Berners-Lee 创办 的 万 维 网 基金 会 纳 人 “开放 数 
据 上 晴雨 表 ” (Open Data Barometer) 全 球 报告 的 
评估 范围 。 


4 


我 国 对 于 开放 政府 数据 的 研究 及 应 用 正 处 
于 起 步 阶 段 ， 早 在 2011 年 起 ， 上 海 、 北 京 等 地 
就 率先 进行 了 政府 数据 开放 的 相关 试验 ， 取 得 
了 一 定 的 成 效 。 我 国 在 国家 的 层面 尚未 建立 开 
放 政 府 数据 的 统一 网 站 或 平台 ， 无 法 实现 政府 
纵向 数据 和 横向 数据 的 整合 集成 ， 数 据 依然 呈 
现 碎片 化 的 分 布 格局 。2014 年 以 来 ， 我 国 开始 
讨论 在 开放 数据 方面 的 相关 计划 和 方案 ， 国 务 
BEF 2015 年 9 月 印发 《促进 大 数据 发 展 行动 纲 
要 》， 明 确 提 出 在 2018 年 底 前 建成 国家 政府 数 
据 统一 开放 平台 1。 

我 国学 术 界 对 于 开放 政府 数据 的 讨论 和 研 
究 ， 开 始 于 美国 政府 2009 年 推行 开放 数据 运 
动 。 通 过 文献 调研 ， 目 前 国内 的 相关 研究 主要 
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集中 在 以 下 三 大 方面 : 中 开放 数据 的 概念 分 析 
和 定义 界定 。 对 于 开放 政府 数据 的 概念 和 定义 ， 
部 分 学 者 从 不 同 的 角度 提出 自己 的 看 法 ， 如 谭 
健 趾 、 李 佳 佳 站 、 相 丽 玲 等 外 和 郑 柯 丫 等 。 
@ 开 放 政 府 数 据 的 理论 基础 建设 和 未 来 展望 的 
研究 。 有 部 分 学 者 集中 探讨 开放 政府 数据 的 内 
涵 、 理 论 基础 、 政 策 基 础 ， 讨 论 和 强调 政府 数 
据 开放 的 社会 意义 和 重要 性 ， 从 电子 政务 和 公 
共管 理 、 法 制 建设 等 层面 介绍 、 分 析 开 放 政 府 
数据 大 环境 和 时 代 意 义 , 如 谭 健 趾 、 相 丽 玲 等 趾 
和 马 海 群 等 中。@) 我 国 实践 现状 总 结 和 外 国 经 
验 的 借鉴 。 英 美 等 国家 的 研究 和 实践 都 早 于 中 
国 ， 有 部 分 学 者 围绕 国外 的 实践 现状 和 经 验 总 
结 进行 研究 和 讨论 , 如 陆 健 英 等 由、 马 海 群 等 巴 、 
RE RSMO ARS, 还 有 部 分 学 
者 对 于 我 国 这 几 年 的 实践 成 果 进 行 了 调研 和 总 
结 ， 如 郑 硕 等 中、 黄 思 棉 等 史 、 周 文 泓 1 和 
wen EO, 

元 数据 (metadata) 是 关于 数据 的 数据 ， 同 
时 也 是 结构 化 的 数据 。 在 网 站 构建 中 引入 信息 
组 织 ， 可 对 网 络 信息 资源 进行 有 效 的 组 织 "1 
在 网 站 信息 资源 组 织 中 使 用 元 数据 对 数据 信息 
资源 进行 描述 ,不仅 方便 用 户 理解 ， 还 可 以 更 
容易 地 通过 机 器 或 计算 机 程序 进行 数据 处 理 ， 
提升 资源 的 可 操作 性 。 因 此 ， 保 障 开 放 数 据 的 
使 用 价值 离 不 开 科 学 的 元 数据 方案 的 支持 ， 数 
据 质 量 越 高 ， 元 数据 的 描述 能 力 越 强 ， 数 据 被 
发 现 和 利用 的 机 会 就 越 大 。 有 关 开 放 政 府 数 据 
平台 的 元 数据 方案 的 研究 ， 近 一 年 来 国内 已 有 
少数 学 者 开展 了 针对 性 的 调研 和 分 析 ， 如 于 梦 
月 等 上 通过 对 北京 市 、 浙 江 省 的 政府 开放 数据 
平台 的 元 数据 方案 进行 调研 ， 提 出 基于 国际 通 
用 的 元 数据 标准 可 以 提高 和 改善 元 数据 的 质量 ; 
吴 钢 等 中 选取 了 美国 英国、 澳大利亚 、 加 拿 大 ， 
以 及 国内 北京 市 和 上 海 市 的 政府 开放 数据 平台 
作为 调研 对 象 ， 对 网 站 平台 的 资源 现状 、 组 织 
和 检索 等 方面 进行 了 对 比 ， 提 出 建设 对 策 ; 赵 
eT PO) 从 政府 开放 数据 平台 数据 共享 的 角度 
出 发 , 以 英国 政府 开放 数据 网 站 作为 调研 对 象 ， 
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查阅 相关 政府 文献 ， 从 文件 结构 、 元 素 组 成 及 
规则 等 方面 总 结 元 数据 标准 的 特点 。 国 内 对 于 
元 素 据 方案 的 规范 、 标 准 等 层面 的 研究 较 少 ， 
而 在 国外 ， 对 于 开放 政府 数据 的 元 数据 规范 性 
的 标准 ， 则 有 诸多 的 研究 ， 如 C. Turbelin 等 
通过 调研 ， 指 出 开放 信息 平台 由 于 缺乏 统一 标 
准 ， 导 致 了 数据 资源 利用 受 限 等 问题 。 对 于 数 
据 资源 以 及 元 数据 的 建设 和 管理 ， 也 有 学 者 和 
机 构 提 出 了 一 些 数据 标准 ， 包 括 开 放 政 府 数据 
标准 8 条 中、W3C eGov Interest Group 发 布 的 
官方 指南 中 和 对 关联 开放 数据 的 技术 标准 中。 

我 国 开放 政府 数据 平台 建设 ,尤其 是 元 数 
据 方案 ， 还 存在 很 大 的 发 展 和 完善 空间 ， 以 达 
到 规范 化 、 标 准 化 、 互 操作 和 机 器 可 读 的 目标 ， 
这 对 于 提高 开放 数据 资源 的 可 用 性 、 改 善 和 便 
利 民 众生 活 、 促 进 科学 技术 研究 和 智慧 城市 建 
设 具有 重要 意义 。 因 此 ， 本 研究 通过 分 析 国 内 
外 开放 政府 数据 的 相关 研究 成 果 ， 选 取 美 国 开 
放 政 府 数据 平台 data.gov 网 站 与 我 国 主 要 的 地 
方 政 府 开 放 数 据 平台 进行 元 数据 方案 方面 的 对 
比分 析 ， 以 期 为 我 国 构 建 统 一 的 开放 政府 数据 
平台 元 数据 方案 标准 提供 参考 建议 。 


@ 国 外 开放 政府 数据 平台 元 数据 方案 


2.1 国外 开放 政府 数据 的 元 数据 标准 

2014 年 1 月 16 日， 政府 关联 数据 工作 组 发 
布 了 由 爱尔兰 国立 大 学 DERI(Digital Enterprise 
Research Institute) 起 草 、W3C 电子 政务 兴趣 小 
组 修改 的 政府 开放 数据 元 数据 的 正式 标准 一 一 
DCAT( Data Catalog Vocabulary) °", 

DCAT iW 1 SE ATA TTA, 17^ 
性 ， 其 中 参考 复 用 了 都 柏林 核心 元 数据 (Dublin 
Core) 、FOAF 本 体 和 SKOS 本 体 的 相关 词汇 ， 
并 且 支 持 数据 目录 之 间 的 互 操作 性 ， 弥 补 由 于 
元 数据 应 用 的 多 样 性 对 资源 共享 产生 的 缺陷 ， 
进 尽量 满足 用 户 和 希望 通过 统一 接口 获取 各 类 信 
息 资源 的 需求 。 主 要 类 及 其 属性 见 图 1°), 

从 图 1 可 总 结 出 ，DCAT 词汇 表 全 面 地 涵 
盖 了 数据 的 属性 ， 提 供 了 基础 的 帮助 用 户 了 
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解数 据 集 基 本 信息 内 容 的 属性 ， 如 dct:title、 
dct:description; 帮助 用 户 查 找 数据 的 属性 ， 如 
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dcat:theme 、dcat:keyword; 帮助 用 户 筛选 数据 的 
属性 ， 如 dct:modified 等 。 


dctype:Dataset 
ZA 


foaf:Agent 


dct:publisher 


skos:inScheme 


skos:ConceptScheme 


dcat:themeTaxonomy 


dcat:Catalog 


dct:title 
dct:description 
dct:issued 
dct:modified 
dct:language 
dct:license 


dct:publisher 


dcat:dataset 


dcat:record 


foaf:homepage 


根据 W3C 统计 ， 目 前 DCAT 及 其 应 用 纲 
要 (Application Profile) 已 被 欧盟 等 多 个 国家 
的 政府 、 组 织 和 机 构 应 用 借鉴 于 数据 开放 的 
实践 中 2 ， 显 示 了 DCAT 的 广泛 适用 性 和 科 
学 性 。 
2.2 美国 开放 政府 数据 平台 元 数据 方案 

从 全 球 开放 数据 运动 发 展 情况 来 看 ， 美 国 
是 开放 数据 运动 的 先行 者 ， 在 开放 政府 数据 上 
处 于 领先 地 位 。2013~2015 年 美国 连续 三 年 在 “ 开 
放 数 据 上 晴雨 表 ”评估 中 排名 前 十 中 。 美 国 各 级 
政府 非常 重视 开放 政府 数据 的 元 数据 标准 化 工 
YE, 目前 国家 数据 门户 的 元 数据 方案 已 建立 了 
对 DCAT 和 Schema.org 的 映射 ， 并 日 在 方案 中 
对 元 数据 字段 进行 了 列表 介绍 加。 到 2016 年 8 
月 ， 美 国 各 级 地 方 政 府 的 开放 数据 门户 网 站 已 
达到 88 个 。 如 纽约 州 政府 于 2013 年 3 月 推出 
开放 数据 平台 Open.ny.gov， 随 后 发 表 了 《开放 


a 
39 


dcat:Dataset 


dct:title 
dct:description 
dct:issued 
dct:modified 
dct:identifier 
dcat:keyword 
dct:language 
dcat:contactPoint 


dct:accrualPeriodicity 
dcat:landingPage 


dcat:Distribution 


dct:title 
dct:description 
dct:issued 
dct:modified 


Qe dct:license 
dcat:distribution 


dct:rights 
dcat:accessURL 
dcat:downloadURL 
dcat:mediaType 
dct:format 
dcat:byteSize 


foaf:primaryTopic 


dcat:CatalogRecord 


dct:title 


dct:description 
dct:issued 
dct:modified 


图 1 DCAT 词汇 表 主 要 类 及 属性 


数据 手册 》， 详 尽 地 描述 了 元 数据 的 构建 原则 
和 方案 。 因 此 选取 美国 作为 参考 对 象 ， 对 我 国 
地 方 政府 开发 和 完善 开放 政府 数据 平台 的 元 数 
据 方案 具有 借鉴 意义 。 
通过 对 美国 开放 政府 数据 平台 data.gov 网 
站 进行 调研 ， 可 以 发 现 ， 每 个 数据 集 详情 页 面 
均 设 置 有 对 数据 集 元 数据 的 专门 描述 ， 见 图 2。 

除了 在 网 页 上 以 HTML 格式 对 元 数据 元 素 
进行 展示 和 解释 以 外 ， 可 下 载 的 元 数据 文件 使 
用 JSON 语法 格式 ， 对 多 值 多 组 属性 的 元 数据 
进行 规范 化 表达 ， 机 需 可 读 性 高 ， 用 户 可 以 下 
载 对 应 的 元 数据 ISON 文件 到 本 地 。 

以 美国 住房 支付 能 力 数据 集 (Housing 
Affordability Data System ) (https://catalog. 


data. gov/dataset/housing-affordability-data-sys- 
tem-hads ) 为 例 ， 数 据 集 的 元 数据 描述 元 素 如 图 
3 所 示 。 该 数据 集中 的 元 数据 元 素 一 级 字段 共有 
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14 个 ， 其 中 contactPoint, distribution, publisher 
三 个 字段 均 包括 若干 二 级 字段 。 美 国政 府 开 放 
数据 平台 元 数据 方案 具有 较 高 的 互 操 作 性 ， 从 
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图 3 展现 出 来 的 元 数据 元 素 可 以 发 现 ， 包 含 了 
DCAT vCard ( 描述 个 人 名 片 信息 ) 、Org( 描 
述 组 织 、 机 构 信 息 ) 等 多 个 数据 目录 。 


Metadata Source 


Data.json Metadata 
Download Metadata 


Harvested from CFPB JSON 


credit-card 
mortgage 


bank-account bank-service complaint consumer credit-report 


debt-collection finance loan money-transfer student-loan 


图 2 美国 开放 政府 数据 平台 元 数据 下 载 页 面 


E 

2 "@type": "dcat:Dataset", 

3 "accessLevel": "public", 

4 "bureauCode": ["025:28"], 

5 "contactPoint": { 

6 "@type": "vcard:Contact", 

J "fn": "Shula Markland", 

8 "hasEmail": "mailto:Shula.Markland@HUD.gov" 
9 }, 

10 "describedBy": "http://www.HUDuser.org/portal/datasets/hads/HADS doc.pdf", 

11 "description": "The Housing Affordability Data System (HADS) is a set of files 
derived from the 1985 and later national American Housing Survey (AHS) and the 2002 
and later Metro AHS. This system categorizes housing units by affordability and 
households by income, with respect to the Adjusted Median Income, Fair Market Rent 
(FMR), and poverty income. It also includes housing cost burden for owner and renter 
households. These files have been the basis for the worst case needs tables since 
2001. The data files are available for public use, since they were derived from AHS 
public use files and the published income limits and FMRs. These dataset give the 
community of housing analysts the opportunity to use a consistent set of 
affordability measures.", 

12 "distribution": [{ 

13 "@type": "dcat:Distribution", 

14 "downloadURL": "http://www.HUDuser.org/portal/datasets/hads/hads.html", 

15 "mediaType": "text/csv" 

16 hl, 

17 "identifier": "HUDO31", 

18 "keyword": ["affordability", 

19 "cost", 

20 "ar", 

21 "households", 

22 "housing", 

23 "income", 

24 "rent", 

25 "renter"], 

26 "modified": "2010-06-01", 

27 "programCode": ["025:000"], 

28 "publisher": { 

29 "@type": "org:Organization", 

30 "name": "US Department of Housing and Urban Development" 

31 }, 

32 "temporal": "1985/2011", 

33 "title": "Housing Affordability Data System (HADS)" 

34 


图 3 美国 住房 支付 能 力 数据 集 元 数据 JSON 文件 示意 图 


33 
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美国 政府 2015 年 2 月 1 日 公布 的 更 新 版 
开放 数据 元 数据 方案 标准 (Project Open Data 


@type 
accessLevel 


accrualPeriodicity 
bureauCode 


@context 
@id conformsTo 
@type 
conformsTo 
describedBy 
dataset 


dataQuality 
describedBy 


description 
distribution 
identifier 
isPartOf 
issued 
keyword 


landingPage 


language 
license 
modified 


contactPoint 


describedByType 
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Metadata Schema v1.1 ) 9 中 列 出 的 数据 集 元 数 
据 方案 元 素 组 成 如 图 4 所 示 : 


hasEmail 


accessURL 
conformsTo 
downloadURL 
describedBy 
describedByType 
description 
format 
mediaType 

title 


primarylITInvestmentUll 


programCode 


publisher 
references 
rights 
spatial 


systemOfRecords 


temporal 
theme 
title 


本 研究 结合 美国 政府 开放 数据 平台 data.gov 
网 站 上 的 数据 集 的 实际 情况 ， 对 美国 政府 开放 
数据 平台 的 元 数据 的 主要 元 素 的 详细 信息 进行 
归纳 ， 见 表 1。 

从 表 1 可见， 美国 政府 开放 数据 平台 采用 
的 元 数据 方案 ， 全面 地 对 数据 集 进 行 了 描述 ， 
除了 包括 标题 、 时 间 、 描 述 、 关 键 词 等 描述 性 
元 数据 以 外 ， 还 设置 了 数据 集 的 时 间 适 用 性 、 
空间 适用 性 等 数据 信息 。 此 外 ， 尽 量 提供 可 规 
范 描述 属性 内 容 的 标准 化 数字 符号 标识 ， 例 如 


@type 
name 
subOrganizationOf 


图 4 美国 开放 数据 元 数据 方案 标准 元 素 组 成 


对 数据 集 的 编号 、 提 供出 版 者 在 行政 系统 中 的 
编码 等 ， 这 些 都 大 大 增强 了 数据 资源 描述 的 规 
WHE, 方便 用 户 在 平台 上 搜寻 、 检 索 所 需 的 数据 ， 
也 可 以 减少 用 户 在 使 用 数据 前 的 数据 预 处 理工 
作 ， 提 高 用 户 在 使 用 数据 时 的 效率 。 

总 体 而 言 ， 美 国政 府 开放 数据 平台 的 元 数 
据 方案 方便 用 户 理解 数据 信息 ， 迅 速 了 解数 据 
内 容 ， 机 器 处 理 和 分 析 的 操作 性 高 ， 并 且 通 过 
多 种 元 数据 方案 标准 之 间 的 映射 ， 解 决 资源 互 
操作 的 问题 。 
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表 1 美国 政府 开放 数据 平台 的 元 数据 的 主要 元 素 
核心 字段 含义 详情 
@type 采用 的 元 数据 标准 类 型 ”所 有 数据 集 均 采用 dcat:Dataset 
title ] 户 可 读 的 数据 资源 标题 自由 文本 ; 用 英文 表述 ， 必 须 提供 详细 介绍 以 供用 户 搜 寻 和 发 现 
description j 户 可 读 的 资源 概要 描述 自由 文本 ; 保证 用 户 可 以 迅速 判断 是 否 对 该 资源 有 需求 


帮助 用 户 搜寻 和 发 现 数据 资源 ， 应 保证 专业 用 户 和 非 


遵循 ISO 8601 Date 格式 ; 数据 集 更 新 、 修 改 的 最 新 时 间 
一 个 数据 对 象 ; 包括 出 版 数据 资源 的 实体 或 其 归属 组 织 


j vCard 数据 目录 ; 包括 数据 资源 发 布 者 的 名 称 和 邮 


间 适 用 性 ， 可 用 地 区 或 经 纬 ) 


KERMI H Hk (Federal Program Inventory ) 列 出 的 关 


于 该 数据 资源 的 最 初 项 目 编号 
EA URL 地 址 
用 于 标注 该 数据 资源 可 公开 获取 使 用 的 程度 ， 


选项 包括 完 


非 公开 三 种 


字符 串 数 组 ; 该 联邦 机 构 在 OMB Circular A-11, Appendix C 中 的 直 


数据 对 象 数 组 ; 描述 数据 集 发 行 相关 信息 的 元 素 的 集合 ， 包 括 访问 


资源 格式 等 9 个 元 数据 元 素 


联邦 机 构 目录 或 数据 库 中 对 该 数据 集 或 API 接口 的 唯一 标识 符 
遵循 ISO 8601 Date 格式 ; 该 数据 集 的 时 间 适 用 性 ， 


即 适用 的 起 始 时 


度 对 空间 范围 进行 描述 


了 关 隐 私 保护 、 国 家 安全 或 其 他 法 律 法 规 声明 
用 来 标识 该 数据 集 或 API 接口 是 否 已 出 版 


keyword 关键 词 标签 | PL 记 
modified 最 新 更 新 时 间 
publisher 资源 出 版 者 
contactPoint 关系 方式 aa A 
as 项 目 代码 了 
describedBy ”数据 集 的 数据 字段 URL AP S| Abid 
osa 访问 级 别 pO aes 
bureauCode 所 属 机 构 代 码 属 机 构 代码 
i eas 地 址 URL、 下 载 地 址 URL, 
identifier 唯一 标识 符 
temporal 适用 时 间 段 间 和 结束 时 间 
spatial 适用 范围 该 数据 集 的 空 
rights 使 用 权限 管理 字符 串 ; 数据 使 用 的 
license 许可 证 FIFE (URL) ; 
references 引用 链接 字符 串 数 组 (URL) ; 


全 我 国 开 放 政 府 数 据 平台 元 数据 方案 


3.1 我 国 开放 政府 数据 平台 元 数据 现状 

开放 政府 数据 平台 建设 是 政府 数据 开放 中 
的 重要 内 容 。 美 国 、 英 国 等 国家 的 开放 数据 运 
动 是 从 中 央 政 府 到 地 方 政府 的 发 展 路 径 ， 而 我 
国政 府 开放 数据 平台 的 构建 是 在 中 央 政 策 指导 
下 ， 由 各 级 地 方 政府 自主 实践 尝试 。 据 统计 ， 
截至 2017 年 4 月 ,我 国有 19 个 地 级 以 上 地 方 
政府 建 有 开放 数据 平台 ,具体 如 表 2 所 示 : 
gg nae rect eee 
调研 ， 可 以 得 出 : 虽然 各 地 方 政府 都 提供 了 
eee a a 
开放 数据 平台 使 用 的 元 数据 方案 不 尽 相 同 ， 格 
式 以 HTML 网 页 为 主 ， 页 面 描述 的 元 数据 元 素 


提供 数据 资源 的 引用 资料 的 URL 地 址 


数量 不 多 、 过 于 简单 ， 不 能 全 面 地 对 数据 集 进 
行 描 述 。 各 个 政府 开放 数据 平台 均 未 提供 统一 
的 元 数据 方案 介绍 报告 ， 只 有 广州 市 政府 数据 
统一 开放 平台 上 对 每 人 
进行 了 文字 描述 , 如 “广州 市 科技 成 果 登 记 信 息 
数据 集 项 目下 的 元 数据 ， 有 年 份 、 企 业 名 称 ( 成 
果 完 成 单位 名 称 或 完成 人 ) 、 地 址 、 联 系 电话 、 
成 果 名 称 、 登 记 时 间 、 更 新 时 间 ， 见 图 5。 广 州 
市 政府 开放 数据 平台 使 用 的 是 数据 集 字段 作为 
该 数据 集 的 元 数据 元 素 ， 而 非 一 致 的 元 数据 方 
案 。 针 对 具体 数据 集 增加 对 资源 的 注释 、 标 签 
等 ， 虽 便于 个 性 化 利用 元 数据 ， 但 在 一 定 程度 
上 会 导致 元 数据 元 素 设置 标准 化 和 规范 化 程度 
低 ， 而 且 不 同 数据 集 之 间 的 元 数据 元 素 组 成 差 
别 较 大 。 
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表 2 我 国 地 方 政府 开放 数据 平 合 列表 
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省 市 平台 名 称 平台 网 址 
北京 市 北京 市 政务 数据 资源 网 www.bjdata.gov.cn 
上 海 市 上 海 市 政府 数据 服务 网 www.datashanghai.gov.cn 
广东 省 开放 广东 数据 服务 网 http//:www.gddata.gov.cn/ 
浙江 省 浙江 政务 服务 网 http//:data.zjzwfw.gov.cn/ 
贵州 省 贵州 省 政府 数据 开放 平台 http//:www.gzdata.gov.cn/ 
广州 市 广州 市 政府 数据 统一 开放 平台 http//:datagz.gov.cn/ 
武汉 市 武汉 市 政府 公开 数据 服务 网 http//:www.wuhandata.gov.cn/ 
青岛 市 青岛 政务 网 政府 数据 开放 http//:data.qingdao.gov.cn/ 
合 尔 滨 市 哈尔滨 市 政府 数据 开放 平台 http//:data.harbin. gov.cn/ 
深圳 市 深圳 政府 数据 开放 平台 http//:opendata.sz.gov.cn/ 
长 沙市 长 沙 数据 开放 http//:data.changsha.gov.cn/ 
无 锡 市 无 锡 市 政府 数据 服务 网 http//:opendata.wuxi.gov.cn/ 
贵阳 市 贵阳 市 政府 数据 开放 平台 http//:www.gyopendata.gov.cn/ 
东莞 数据 东莞 网 http//:dataopen.dg.gov.cn/ 
佛山 市 佛山 市 数据 开放 平台 http//:www.fsdata.gov.cn/ 
梅州 市 梅州 市 人 民政 府 数据 开放 平台 http//:www.meizhou.gov.cn/ opendata 
湛江 市 湛江 市 政府 数据 服务 网 http//:data.zhanjiang.gov.cn/ 
肇庆 市 肇庆 市 人 民政 府 “ 用 数据 ”模块 http//:www.zhaoqing.gov.cn/sjkf/ 
佛山 市 南海 区 数 说 南海 http//:data.nanhai.gov.cn/ 


数据 目录 数据 分 析 地 图 服务 应 用 服务 开发 服务 互动 交流 网 站 统计 


广州 市 科技 成 果 登 记 信息 当前 评分 : vy vy vy ve vy 0.0(0 
人 评分 ) 
Et 所 属 主题 ; 科技 
x 7 更 新 周期 : 每 年 
描述 信息 元 数据 数据 管理 。 服务 接口 。 相关 数据 祖 关 应 用 
序号 英文 名 称 中 文 名 称 数据 格式 是否 搜索 项 是 否 排序 项 中 文 描述 
1 NF 年 份 文本 v v 年 份 
企业 各 称 ( 成 果 完 成 单位 名 
2 QYMC 文本 v v 企业 名 称 ( 成 果 完 成 单 . 
称 或 完成 人 ) 
3 DZ 地 址 文本 hd v 地 址 
4 LXDH 联系 电 活 文本 v v 联系 电话 
5 CGMC 成 时 匀称 文本 v v 成 果 名 称 
6 DIS) 登 ;时 间 文本 v Vo Sma 
7 UPDATE TIME 。 更 新 时 间 文本 v v 更 新 时 间 


图 5 广州 市 政府 数据 统一 开放 平台 元 数据 描述 展示 
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此 外 ， 我国 地 方 政府 开放 数据 平 合 均 未 
提供 元 数据 的 文件 ， 仅 在 网 页 上 进行 展示 ， 
影响 数据 开放 利用 的 效果 ， 不 利于 实现 开放 
数据 的 规范 化 、 标 准 化 、 互 操作 性 和 机 需 可 
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读 性 的 目标 。 通 过 查看 各 网 站 HTML 页 面 的 
元 素 标 签 ， 对 部 分 地 方 政府 的 开放 数据 平台 
元 数据 核心 元 素 组 成 情况 进行 了 总 结 ， 如 表 
3 所 示 : 


表 3 我 国 主要 地 方 政 府 的 开放 数据 平台 元 数据 元 素 组 成 情况 


数据 开放 平台 名 称 eee 核心 元 素 组 成 情况 
a 资源 名 称 、 资 源 出 版 日 期 、 资 源 分 类 、 资 源 摘要 、 资 源 所 有 权 单 位 、 
北京 市 政务 数据 资源 网 8 关键 字 说 明 、 资 源 类 型 、 资 源 记 录 数 
访问 / 下载 次 数 、 摘 要 、 关 键 字 、 数 据 领 域 、 国 家 主题 分 类 、 部 门 主 
上 海 市 政府 数据 服务 网 2O 题 分 类 、 公 开 属性 、 更 新 频率 、 发 布 日 期 、 数 据 提供 方 单位 、 数 据 
是 供 方 地 址 。 附 件 下 载 
a 文件 名 .文件 大 小 、 下 载 次 数 、 上 传 时 间 .资源 摘 要 、 关 键 字数 据 来 源 、 
江 政务 服务 网 10 信息 资源 发 布 日 期 、 信 息 资源 提供 方 、 更 新 频率 
资源 状态 、 资源 访问 、 数据 简介 、 关键 字 、 更 新 时 间 、 原 数据 发 布 时 间 、 
武汉 市 政府 公开 数据 服务 网 。 11 主题 分 类 、 数 据 条 数 、 机 构 名 称 、 机 构 简介 、 机 构 地 址 
ERN 评分 人 数 、 访 问 次 数 、 下 载 次 数 、 评 论 次 数 、 数 据 量 、 所 属 主题、 
岛 政务 网 政府 数据 开放 。 11 数据 语种 、 标 签 、 部 门 、 发 布 时 间 、 更 新 周期 
分 类 、 数 据 适用 范围 、 下 载 次 数 、 更 新 频率 、 创 建 时 间 、 浏 览 次 数 、 
? 关键 字 、 最 后 修改 时 间 、 开 放 等 级 
广州 市 政府 数据 统一 开放 平台 。 5 ”数据 来 源 、 数 据 量 、 发 布 时 间 、 所 属 主题 、 更 新 周 其 
深圳 政府 数据 开放 平台 3 公开 属性 、 所 属 部 门 、 更 新 时 间 
福田 数据 开放 平台 5 资源 格式 、 关 键 字 项 、 数 据 地 址 、 数 据 介绍 、 共 享 说 明 
发 布 机 构 、 资 源 格式 、 下 载 次 数 、 关 键 字 项 、 所 属 主题 、 创 建 时 间 、 
数 说 南海 q 更 新 时 间 
摘要 、 关 键 字 、 浏 览 次 数 、 访 问 / 下 载 次 数 、 更 新 频道 、 发 布 日 期 、 
湛江 市 政府 数据 服务 网 12 HERON HEARD, MRE, AERD, 
公开 属性 、 评 
从 表 3 可 以 看 出 ， 目 前 各 个 地 方 政 府 开 公开 元 数据 中 的 部 分 核心 元 素 ( 见 表 4P2 ) ， 
放 数 据 平 台 的 元 数据 设置 主要 包括 : 基本 描 内 涵 大 致 与 都 柏林 核心 元 素 中 的 一 致 ， 表 明 


述 性 元 数据 ， 如 标题 、 摘 要 、 关 键 字 、 发 布 
者 ; 基本 管理 性 元 数据 ， 如 资源 创建 时 间 、 

更 新 时 间 ; 另外 还 有 少量 的 使 用 性 元 数据 ， 

如 用 户 访 问 和 下 载 情况 。 上 海 市 政府 数据 服 
务 网 ( http://www.datashanghai.gov.cn ) 在 
内 起 步 较 早 ， 发 展 较 快 ， 从 数据 量 、 开 放 性 、 
时 效 性 和 易 用 性 等 方面 优 于 其 他 省 市 地 区 。 
对 比 表 3 中 的 我 国 其 他 地 方 政 府 开放 数据 平 
台 的 元 数据 情况 ， 上 海 市 政府 数据 服务 网 的 
元 数据 方案 的 设置 相对 来 说 较 全 面 和 详尽 。 
此 外 ， 由 表 3 可见， 我 国 地 方 政 府 开 放 数 据 
平台 的 元 数据 方案 基本 参考 和 沿袭 政府 信息 


我 国 开发 政府 数据 平台 的 元 数据 方案 仍 停留 
在 政府 信息 公开 的 阶段 。 
3.2 我 国 地 方 政府 开放 数据 平台 
建议 

开放 政府 数据 平台 作为 多 个 政府 机 构 和 部 
门 大 量 数据 汇集 的 信息 中 心 ， 除了 具有 普通 的 
政府 平台 的 信息 收集 、 信 息 整 理 、 信 息 发 布 、 
言 息 传播 的 功能 以 外 ， 开 放 政 府 数 据 平 台 最 主 
要 的 功能 是 为 社会 各 界 提 供 公 开 的 政府 数据 集 。 
开放 政府 数据 的 共享 利用 离 不 开元 数据 的 支持 ， 
作为 数据 集 附 加 高 质量 的 元 数据 描述 ， 是 实现 
数据 目录 之 间 互 操作 的 基础 。 虽然 目前 元 数据 


元 数据 的 不 足 及 
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#4 政府 信息 公开 元 数据 方案 核心 元 素 


元 素 名 称 ”DC 映射 子 元 素 
日 A 并 列 题名 、 副 题名 即 说明 
题名 Title 题名 文字 
创建 者 Creator 
主题 Subject 目录 分 类 
说 明 Description 摘要 、 目 录 


其 他 责任 者 Contributor 


出 版 者 Publisher 
日 期 Date sia re 日 期 、 修 
语种 Language 
覆盖 范围 Coverage 时 间 范 围 、 空 间 范围 
标识 符 Identifier 
资源 类 型 Type 
AEE BI] 3 
Het omat “在 入 介质 文件 、 页 全 
来 源 Source 
被 蔡 代 、 蔡 代 、 组 成 、 部 
关联 资源 Relation ”分 为 、 w BR. we 
4 
权限 Rights 
索引 号 
文件 编号 


的 设置 看 起 来 能 满足 各 地 方 政府 开放 数据 的 基 
本 需求 ， 但 是 从 用 户 查 询 、 使 用 、 机 器 可 读 性 
等 方面 都 远 落 后 于 国际 上 的 标准 。 通 过 分 析 对 
比美 国政 府 开放 数据 平台 的 元 数据 方案 ,我 国 
各 地 方 政 府 开放 数 据 平 台 的 元 数据 方案 主要 有 
以 下 几 个 方面 的 不 足 : 

C1) 各 地 方 政府 的 元 数据 方案 缺乏 统一 的 
标准 。 由 于 我 国政 府 数据 开放 运动 是 由 地 方 政 
府 自主 开展 ， 因 此 难免 产生 各 地 方 的 元 数据 方 
案 之 间 差 异 较 大 的 现象 ， 主 要 表现 为 在 元 素 组 
成 、 名 称 和 格式 上 的 不 一 致 。 这 为 基于 政府 开 
放 数 据 的 应 用 开发 带 来 困难 ， 由 于 缺乏 统一 的 
数据 集 元 数据 方案 ， 跨 多 个 数据 目录 读 取 数据 
将 产生 很 高 的 处 理 复杂 性 和 成 本 代价 。 

(2) 未 提供 机 器 可 读 的 元 数据 格式 。 各 个 
地 方 政府 开放 数据 平台 仅 在 网 页 上 HTML 页 面 
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的 形式 展现 元 数据 标签 ， 并 没有 提供 元 数据 下 
载 的 文件 ， 这 不 利于 数据 的 互 操作 性 和 机 器 处 
理 。 目 前 国际 上 使 用 广泛 的 元 数据 文件 格式 是 
JSON 格式 和 XML 格式 。 

(3 ) 元 数据 元 素 组 成 无 法 全 面 描述 数据 集 
的 信息 。 可 以 看 到 现 有 的 地 方 政 府 开放 数据 平 
台 的 元 数据 均 未 设置 唯一 的 资源 标识 符 元 素 ， 
不 利于 数据 的 规范 性 和 稳定 性 ; 也 未 提供 对 相 
关 资 源 的 参照 和 关联 、 开 放 许 可 、 时 空 覆 盖 范 
围 等 常用 的 元 数据 元 素 。 

(4) 未 提供 详细 的 平台 元 数据 方案 标准 的 
介绍 报告 。 缺 乏 元 数据 方案 的 使 用 手册 和 说 明 
信息 ， 会 增加 用 户 使 用 元 数据 的 难度 和 成 本 ， 
削减 用 户 开 发 政府 开放 数据 的 动 万 和 激情 ， 不 
利于 数据 的 增值 利用 。 

(5 ) 同一 开放 数据 平台 中 的 元 数据 格式 不 
规范 。 例 如 浙江 省 政府 数据 开放 平台 上 不 同 数 
据 集 对 于 “文件 大 小 ”的 取 值 格式 不 一 致 ， 有 
些 带 了 单位 (如 100KB ) ， 有 些 不 带 单位 (如 
100) 。 

基于 以 上 不 足 ， 我 国政 府 应 积极 规范 平台 
资源 组 织 和 描述 的 方式 ， 借 鉴 国际 上 成 熟 有 效 
的 元 数据 方案 标准 ， 制 定 统一 规范 的 元 数据 方 
案 ， 使 元 数据 元 素 组 成 全 面 地 对 数据 资源 进行 
描述 ,方便 用 户 搜寻 、 检 索 、 浏 览 、 识 别 数据 。 
严格 标准 化 各 个 元 数据 字段 的 取 值 格式 ， 提 供 
详尽 的 元 数据 方案 报告 ， 以 提升 数据 的 开放 性 
和 机 器 可 读 性 ， 确 保平 台 能 够 真正 提供 满足 社 
会 需求 的 高 质量 、 高 价值 数据 。 


QRH 


开放 政府 数据 是 一 场 全 球 性 的 浪潮 ， 是 社 
会 大 众 对 政府 管理 方式 的 新 的 要 求 ， 也 是 国民 
经 济 发 展 的 需要 。 我 国政 府 开 放 数 据 是 大 势 所 
趋 ， 目 前 与 美国 等 发 达 国家 相 比 ， 仍 有 很 大 的 
差距 。 我 国 已 有 的 地 方 政 府 开放 数据 平台 建设 
都 存在 着 资源 转化 率 低 下 的 问题 ， 通 过 提高 信 
息 资 源 组 织 的 科学 性 ， 采 用 统一 的 元 数据 标准 
对 数据 进行 描述 , 更 高 效 快速 地 满足 其 他 机 构 、 
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组 织 、 个 人 ， 在 查询 、 检 索 、 


识 1) 


存储 、 传 


递 、 利 用 以 及 二 次 开发 的 过 程 中 的 用 户 需 求 ， 
真正 达到 开放 数据 推动 信息 惠 民 和 社会 化 开发 
利用 的 目的 。 在 开放 政府 数据 的 实施 技术 手段 


上 ， 可 以 直接 采用 国际 上 先进 的 、 最 有 利 
现 数据 价值 的 方式 ， 


F3 


快速 提升 应 用 数据 的 能 力 。 


在 政府 开放 数据 元 数据 的 规范 化 和 标准 化 方面 ， 


借鉴 和 参考 国际 通用 的 元 数据 标准 将 是 一 个 
要 的 发 展 方向 。 
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A Comparative Study on Metadata Scheme of Chinese and American Open Data 
Platforms 


Yang Sinan 
School of Information Management, Sun Yat-Sen University, Guangzhou 510006 

Abstract: [Purpose/significance] Open government data is conducive to the rational development and uti- 
lization of data resources. It can encourage social innovation and promote economic development. Besides, 
in order to ensure effective utilization and social increment of open government data, high-quality metadata 
schemes is necessary. [Method/process] Firstly, this paper analyzed the related research of open government 
data at home and abroad. Then, it investigated the open metadata schemes of some Chinese main local gov- 
ernments’ data platforms, and made a comparison with the metadata standard of American open government 
data. [Result/conclusion] This paper reveals that there are some disadvantages about Chinese local govern- 
ment open data affect the use effect of open data, which including that different governments use different 
data metadata schemes, the description of data set is too simple for further utilization and usually presented 
in HTML Web page format with lower machine-readable. Therefore, our government should come up with 
a standardized metadata schemes by drawing on the international mature and effective metadata standard, to 
ensure the social needs of high quality and high value data. 
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